专利摘要:
用於在內文提供者間進行最新新聞關聯的方法與系統包含從一內文提供者接收一最新新聞之最新新聞頭條。該最新新聞頭條則利用識別複數個頭條標記的方式,進行實質即時標記化。從複數個內文提供者接收複數個新聞。該複數個新聞的每一新聞都被標記化,以識別複數個新聞標記。分析該複數個頭條標記與該複數個新聞標記,以決定該一或多個新聞是否與該最新新聞頭條有關。根據該分析將該一或多個最新新聞映射至該最新新聞頭條。該映射關係能夠在展示該最新新聞頭條的同時,呈現來自該一或多個內文提供者之一或多個新聞。
公开号:TW201305959A
申请号:TW101110515
申请日:2012-03-27
公开日:2013-02-01
发明作者:Abhijit Khasnis;Subramanian Narayanan
申请人:Yahoo Inc;
IPC主号:G06Q10-00
专利说明:
不同內文提供者間相關最新新聞之即時關聯
本發明與最新新聞有關之即時資訊準備有關,且更特別的,本發明與將不同內容提供者之新聞及最新新聞頭條建立關聯有關。
隨著網際網路流行性的迅速增加,可在網際網路上獲得大量的資訊。實際上,使用者依賴網際網路做為獲得最新新聞資訊的較佳來源。最新新聞與有關目前發生中事件的簡短資訊相關。線上新聞服務提供者從複數個內容提供者接收該最新新聞,並再從該內容提供者接收時呈現該最新新聞。在想要最快提供該最新新聞資訊的緊急性下,該內容提供者通常提供該最新新聞頭條為新聞閃爍或新聞「嵌條」,並在該新聞閃爍或新聞「嵌條」之後提供該最新新聞的其他資訊。當該等服務提供者從複數個內容提供者接收該最新新聞閃爍與相關新聞時,該等服務提供者整合來自於該相同內容提供者的該最新新聞頭條與該最新新聞的相關資訊,並以先來先呈現的方式對該等使用者呈現該最新新聞。
然而,在想要更快提供該等使用者資訊的驅動下,該等內容提供者所提供之資訊可能不完整、缺乏足夠的資料/深度,或可能包含錯誤。該等服務提供者目前並不具備將從其他內容提供者來源所獲得之資訊與該來自特定內容提供者之該最新新聞頭條建立相互關聯的能力。缺乏足夠的資料/深度或不完整的資訊可能使該等使用者離開該服務提供者的網點。因此有利的是使該等服務提供者具有將來自複數個內容提供者之該等新聞與最新新聞見相互關連之能力,而提供該等使用者高品質之新聞。
上述便是產生本發明實施例的背景。
本發明實施例描述將最新新聞頭條與複數個新聞進行關聯的方法與裝置,其利用使來自複數個內容提供者之內容與特定內容提供者所提供之該最新新聞頭條建立相互關係的方式完成。最新新聞之該最新新聞頭條係從特定內容提供者所接收。一旦接收之後,對該最新新聞頭條進行動態標記化,以識別實質描述該最新新聞頭條的複數個頭條標記。從複數個內容提供者接收複數個新聞。提供該等新聞之一或多個新聞的內容提供者可以與提供該最新新聞頭條的提供者相同,也可以不同。一旦接收之後,以實質即時的方式將該等新聞的每一新聞進行標記化,以識別複數個新聞標記。分析該頭條標記與該新等聞標記,已決定該複數個新聞之一或多個新聞是否與該最新新聞頭條有關。當發現該等新聞之一或多個新聞與該最新新聞頭條有關時,該等相關新聞便以實質即時方式映射至該最新新聞頭條,因此可以與該最新新聞頭條一起對使用者呈現該等相關新聞。所呈現之資訊並不限制於來自提供該最新新聞頭條之單一內容提供者的資訊,其也可以包含來自複數個內容提供者的新聞。所呈現之資訊使使用者對於與該最新新聞頭條有關之發展中新聞能獲得一更完整的理解,藉此保持該使用者持續拜訪該服務提供者之網點。
傳統的應用方式使用比對該等新聞內容與該頭條主題的耗成本演算法識別與該最新新聞頭條有關的新聞。此比對形式耗時且增加工作負擔。取而代之的是,本發明實施例利用實質上描述該頭條與該等新聞的標記以尋找比對關係,可形成較少的工作負擔同時提供有效的結果。此外,本發明以實質即時的方式,利用動態標記化、比對與呈現該最新新聞頭條相符新聞的方式使發布新聞更加快速。
應該了解到本發明可以多種方式實作,像是實作為方法、系統或是裝置。以下將描述本發明的許多實施例。
廣泛來說,本發明實施例提供在電腦可讀媒介中的方法及電腦演算法,該方法與演算法用以將從特定內容提供者所接收之最新新聞頭條與從複數個內容提供者所接收之新聞建立關聯。該最新新聞頭條與該等新聞將以動態方式標記化,且以實質即時的方式分析該等標記,以決定該等新聞何者與該最新新聞頭條有關。該等相關新聞以實質即時方式映射至該最新新聞頭條,因此呈現該最新新聞頭條時,可在該最新新聞頭條下方展示由服務提供者所提供的該等新聞。該等相關新聞可以來自不同於提供該最新新聞頭條之內容提供者,也可以來自於相同的內容提供者。
該電腦演算法解決傳統應用工具的某些缺點。該等傳統應用工具可將來自於特定內容提供者之最新新聞頭條與來自該相同提供者之新聞建立關聯。這使得使用者只能獲得最新新聞的任一單一觀點,限制了該使用者的使用經驗。此外,該傳統應用利用比較該新聞內容的方式進行該等新聞比對,以決定該內容是否與該最新新聞相符。這種比對方式造成不必要的時間花費,而在對該使用者呈現有關該最新新聞的資訊時形成延遲。在令人滿意的即時資訊時代中,這種延遲對服務提供者造成成本浪費,而使該使用者離開該服務提供者的網點。另一方面,本發明的演算法提供一種將來自不同內容提供者之新聞與該最新新聞頭條建立關聯的效率方式,因此可使使用者獲得有關該最新新聞頭條多樣且更廣泛的觀點。同樣的,該演算法使用標記比對該等新聞與該最新新聞頭條,該演算法使用較低的時間,且能夠更快速的提供結果,並以更完整的方式豐富該使用者的使用經驗,藉此提高連接至該服務提供者網點的流量。由以下對於各個實施例的詳細描述將使其他優點變的明確。
對於本發明的一般瞭解,現在將參考附加圖式討論特定實施例。第一圖描述本發明一實施例中一系統的簡化塊狀圖式,該系統用於將來自不同內容提供者之新聞與一最新新聞頭條建立關聯。在服務提供者的伺服器100上具有像是比對演算法102的演算法,該演算法透過該網際網路130接收代表最新新聞事件的最新新聞頭條,並從複數個內容提供者110接收新聞。該比對演算法102與記憶體模組103及快取記憶體104於處理該最新新聞頭條與該等新聞的期間,與記憶體模組103及快取記憶體104互動,該記憶體模組103及該快取記憶體104則位於該伺服器100上。該快取記憶體104用於儲存該最新新聞頭條與該等新聞,以進行快速取得。該記憶體模組103則在處理期間使用。該比對演算法102包含程式指令,該程式指令經配置以從內容提供者接收最新新聞,並識別從各個內容提供者所接收與該最新新聞有關的新聞。該等相關新聞以實質即時的方式映射至該最新新聞,因此當呈現該最新新聞時,便為該使用者於該最新新聞旁展示該等相關新聞,以供該使用者存取及檢視。在一實施例中,可以以其他鏈結方式提供該一或多個相關新聞。
為了協助進行該等相關新聞與該最新新聞頭條的比對,本發明演算法也包含複數個模組,像是標記化器102a、比對器102b、映射器102c,該等模組包含邏輯以接收並處理該等新聞與該最新新聞頭條。該標記化器102a經配置以從內容提供者接收該最新新聞頭條,並將該最新新聞頭條標記化,以實質即時的方式識別複數個頭條標記。該標記化器102a與該快取記憶體104互動,以將該最新新聞頭條及該對應頭條標記儲存於該快取記憶體104中,以供後續取得。該標記化器102a也經配置以從複數個內容提供者接收新聞。當從內容提供者接收新聞時,該標記化器102a以實質即時的方式對該新聞標記化,以識別複數個新聞標記。該標記化器102a儲存該新聞與該對應新聞標記,以供後續取得。該比對器模組102b經配置以從該快取記憶體104取得該頭條標記與該等新聞之新聞標記,並分析該頭條標記與該等新聞標記,根據在該比對演算法中可利用之預定比對條件決定該新聞是否與該最新新聞頭條有關。該比對條件可以具體指明所需要的相符百分比,以使該比對器模組102b聲明該新聞與該最新新聞頭條有關。
一旦發現相符關係後,該映射器模組102c將該相關新聞與該最新新聞頭條進行鏈結。該鏈結可以利用該新聞關聯之識別符將該最新新聞頭條標籤化的方式進行,像是利用一種通用唯一識別符(UUID)。該鏈結建立該最新新聞頭條與該相關新聞之間的關係。如果存在多於一筆與該最新新聞頭條相符的新聞,那麼該映射器模組102c將不只利用與該等相關新聞關聯之識別符將該最新新新聞頭條進行標籤化,也利用與該最新新聞頭條有關之該等剩餘新聞的識別符將該等相關新聞的每一新聞進行標籤化。接著將由該鏈結所識別的該最新新聞頭條與該等相關新聞回傳至客戶端使用者120,以實質即時的方式進行展示。
第二圖描述本發明一實施例中將最新新聞事件標記化的簡化塊狀圖式。如先前所提及,為了回應最新新聞事件,特定內容提供者可以利用新聞閃爍(flash)的方式或新聞「嵌條(slug)」提供服務提供者該最新新聞的資訊,該新聞閃爍/新聞嵌條是一種簡述,通常只有實質描述該最新新聞的單一行資訊。例如在第二圖描述的實施例中,像是「Associated Press(AP)」的內容提供者以最新新聞頭條-「Interpol issues ‘Red Notice’for Wikipedia’s Assange,”B1」的形式提供該新聞閃爍。在一實施例中,該內容提供者可以使用與該內容提供者關聯的特定頻道,像是AP最新新聞頻道,以只提供該新聞閃爍(或是「頭條」或「新聞嵌條」),並使用其他頻道提供新聞至服務提供者。在該服務提供者之伺服器上可利用的演算法於從特定內容提供者接收頭條時進行偵測,並以實質即時的方式利用識別複數個頭條標記的方法對該頭條標記化。除了偵測該頭條之外,該演算法可以記錄從該內容提供者接收到該最新新聞頭條的時間。例如,時間「T0」分鐘可以記錄當在該伺服器處接收該最新新聞頭條(或只是簡單的「頭條」)的時間。在進行標記化提,該演算法從該頭條識別實質描述該頭條的關鍵字。該等已識別關鍵字定義代表該頭條的標記。例如,對於第二圖中所識別的最新新聞頭條而言,該演算法可能識別下述的頭條標記-「Interpol」、「Wikileaks」及「Assange」,如以圖示「1a」所描述。該等頭條標記可以與該最新新聞頭條一起儲存於該快取記憶體中,以供後續取得。
在一實施例中,在接收該最新新聞頭條並進行標記化以後,該演算法進行從內容提供者接收新聞的偵測,像是從CNN所接收的新聞「CNN 1」。除了偵測該新聞之外,該演算法也可以記錄從該內容提供者接收與該最新新聞頭條有關之新聞的時間。例如,偵測到已經在接收該最新新聞頭條後大概T0+2分鐘時,從該內容提供者接收該新聞CNN 1。該新聞CNN 1包含描述該內容的標題,像是「Interpol puts Assange on Most-wanted list」。該演算法分析該新聞標題,並利用識別實質描述該新聞之複數個新聞標記的方式對該新聞標記化,如利用圖示「1b」所描述。該新聞與該標題的標記化動作則於從該個別內容提供者接收該新聞與頭條時,以實質即時的方式完成。對於以上的新聞範例,分析該新聞標題之後產生的新聞標記可以包含「Interpol」及「Assange」,這些標記實質上描述從該內容提供者所接收的新聞內容。在此應該注意提供該新聞的該內容提供者(CNN)可以與提供該最新新聞頭條的內容提供者(AP)不同,或可以與提供該最新新聞頭條的內容提供者相同。在此也應該注意提供該新聞的內容提供者也可以提供其他與該最新新聞頭條有關的新聞。除了該等新聞標記之外,該演算法可以產生從該等內容提供者所接收之每一個新聞的通用唯一識別符(UUID),像是UUID(CNN 1)等。
一旦完成該最新新聞標題與該新聞的標記化之後,該演算法便進行標記比對,如第三圖所描述。在此階段中,該演算法從儲存該最新新聞頭條之頭條標記的快取記憶體取得該頭條標記,並將該複數個頭條標記的每一頭條標記以及與該新聞關聯之該複數個新聞標記的每一新聞標記進行比對,以決定該頭條標記與該等新聞標記是否相符,並決定其相符的程度。利用在第二圖中所描述的範例,該演算法決定該最新新聞頭條的三個頭條標記(「Interpol」、「Wikileaks」及「Assange」)中有兩個(「Interpol」及「Assange」),與用於該新聞所產生之兩者標記相符,如利用圖示「2」所描述。在此應該注意第二圖中所描述的範例所識別的單一新聞為一種用於例證目的的簡化情況,而應該視其為示範例而非用於限制。因此,該演算法可以偵測由複數個內容提供者隨時間所傳輸的複數個新聞,並利用分析該個別標題的方式對該等新聞的每一新聞標記化,以產生複數個新聞標記,並使用該等已產生新聞標記,與該最新新聞頭條關聯之該等頭條標記進行比對。
在一實施例中,在標記比對時使用預定比對條件以決定特定新聞與該最新新聞頭條的相符程度。在一實施例中,該預定比對條件可以具體指示特定新聞之該等新聞標記必須與該最新新聞頭條之該等頭條標記有關而相符的比例或數量。在一實施例中,該比對條件可以只根據個別標記相符的比例/數量進行該等新聞與該最新新聞頭條的比對,也可以使用與該最新新聞頭條及該等新聞關聯的其他屬性,給予該等新聞針對於該最新新聞頭條的排序與優先化。例如,除了識別該相關新聞相符標記的比例/數量之外,該比對條件也可以包含考量該等新聞針對特定最新新聞頭條進行排序時的衰減因子。在一實施例中,該衰減因子可以具體指明接收該最新新聞頭之時間與接收該新聞進行比對/映射之時間之間的延遲。隨著該最新新聞事件捕捉具有重要性並快速發展的新聞,該衰減因子將使該演算法識別相關、新穎的新聞,並提供更廣泛的觀點。因此,在比對新聞與該最新新聞頭條的期間,除了比對該新聞標記與該頭條標記之外,該演算法也檢查每一新聞的衰減因子,以動態方式將該新聞相對於其他新聞進行排序與優先化,在一實施例中,最舊的新聞具有較小的權重,而最新的新聞具有較大的權重。這使得在呈現該等相關新聞時,係以與該最新新聞頭條之間的相關性與新穎性所呈現。應該注意的是該衰減因子為該新聞的一種屬性,係用於將該等新聞針對適當的最新新聞頭條進行排序與優先化。除了該衰減因子之外,該等新聞也可以根據與該內容提供者的相關性進行排序及優先化。與特定內容提供者之間的相關性,可以透過捕捉在該特定內容提供者提供該一或多個新聞時的使用者互動,相對於其他內容提供者提供該等其他新聞時的使用者互動所決定。
除了該衰減因子之外,該比對條件可以包含用於探掘及報告相關最新新聞頭條之該等新聞的時間框。由於儲存該最新新聞頭條與該等相關新聞以進行快速取得之快取記憶體,本身係為有限資源的因素,以及由於及時報告該最新新聞頭條的急迫性,可使該時間框維持足夠短以能為了該最新新聞頭條及時處理及報告在該時間框中所已接收的該等新聞,並同時保有其他最新新聞頭條相關資訊的儲存空間,因此能夠有效利用該快取記憶體資源以儲存其他最新新聞頭條。
當接收該等新聞時,該演算法以動態方式對該等新聞標記化,從該快取記憶體取得該等頭條標記,並利用該比對條件比對該等新聞標記與該等頭條標記,以決定那些新聞與該頭條有關。該等相關新聞的新聞標記與該等新聞一起儲存於該快取記憶體之中,以供後續取得。一旦決定該等相關新聞之後,在一實施例中該演算法根據該相符比例/程度對該等相關新聞進行排序及優先化,利用相關程度的次序與該頭條一起展示。在一實施例中,在該頭條下方以鏈結方式展示該等各種相關新聞。如果有兩個新聞具有與該頭條之間相同的相符程度,那麼該演算法將根據從該等個別內容提供者所接收之該兩個新聞的時間進行排序及優先化(也就是根據衰減因子)。因此該演算法可以以實質即時方式,提供從該等各種內容提供者所接收與該頭條最為相關的該等新聞。
一旦識別該頭條之該等相關新聞之後,該等新聞便與該頭條進行鏈結,因此能與該頭條一起呈現給該使用者。第四圖描述本發明一示範實施例中該等新聞與該最新新聞頭條的鏈結方式。如圖所示,一旦決定與該新聞CNN 1關聯之新聞標記與與該最新新聞頭條B1關聯之頭條標記相符之後,便在該頭條中為該相符新聞建立鏈結。該鏈結建立該最新新聞頭條與該新聞之間的關係。在一實施例中,利用該新聞之識別符將該最新新聞頭條標籤化的方式建立該鏈結,例如,利用UUID(CNN 1)進行標籤化。以實質即時的方式對該使用者呈現該最新新聞頭條與利用該鏈結所識別之該相關新聞。該鏈結也與該最新新聞頭條、該等頭條標記、該新聞以及該等新聞標記一起儲存於該快取記憶體中,以供後續取得。
該快取記憶體允許對其本身所包含的資料進行快速取得。因此,當從內容提供者接收新聞時,將該新聞標記化、從該快取記憶體取的頭條標記、分析該頭條標記與該新聞標記以決定是否相符。當該頭條標記與該新聞標記相符時,便根據其相符程度將該新聞與該頭條進行鏈結。接著將該新聞、該等新聞標記與該鏈結儲存於該快取記憶體中,因此便可快速取得該等相關新聞與該最新新聞頭條,以在該使用者請求時呈現給該使用者。如果該新聞並不與該目前最新新聞頭條相關,便將該等標記與該新聞儲存於該快取記憶體中,以供之後可能接收之其他最新新聞頭條進行關聯性的探掘。因此,當後續接收其他最新新聞條時,便可已位於該快取記憶體中之該新聞的新聞標記與最新新聞之頭條標記進行比較,並在相符時對該使用者呈現。
第五圖描述本發明一實施例中該最新新聞事件及標記化之詳細描繪。如同所描繪,從內容提供者接收最新新聞頭條,並在接收該最新新聞頭條之後接收複數個新聞。該演算法能在從內容提供者接收該最新新聞頭條時進行偵測,並利用該頭條中可利用之關鍵字動態產生標記。在第五圖描述的範例中,於時間T0時從內容提供者「AP」接收該最新新聞頭條B1,並在大約時間T0時由該演算法為該頭條產生由圖示「1a」所描述之「Interpol」、「Wikileaks」及「Assange」頭條標記。將該頭條與該頭條標記保留在與執行該演算法之該服務提供者關聯伺服器計算裝置的暫存快取記憶體中。在接收該頭條之後從內容提供者接收複數個新聞,像是新聞1、2、3等等。該等新聞係從不同內容提供者所接收,而每一內容提供者都提供一或多個新聞。在第五圖描述的範例中,於時間T0+2.2分鐘時從該內容提供者「AP」接收新聞1,於時間T0+2.5分鐘時從該內容提供者「Reuters」接收新聞2,於時間T0+3.5分鐘時從該內容提供者「AP」接收新聞3等等。如同所示,提供該頭條的該內容提供者與提供新聞1及新聞3的該內容提供者相同。該演算法於該新聞從該內容提供者抵達時進行偵測,並對該新聞進行標記化以實質即時的方式產生新聞標記,如利用圖示「1b」所描述。因此,該演算法於大約時間T0+2.2分鐘時從該新聞1產生新聞標記「Wikileaks」、「Assange」與「fugitive」,於大約時間T0+2.5分鐘時從該新聞2產生新聞標記「Interpol」、「Wikileaks」及「Assange」,於大約時間T0+3.5分鐘時從該新聞3產生新聞標記「Wikileaks」、「Assange」與「fugitive」,其中T0為目前儲存於快取記憶體中之最新新聞頭條的接收時間。不管提供該內容的內容提供者為何,該等新聞的每一新聞都於接收時與唯一使用者識別符及對應新聞標記一起明確儲存於該暫存快取記憶體之中。
當接收新聞時,該演算法將產生該新接收新聞的新聞標記。接著該演算法從該快取記憶體取得該頭條標記、分析該頭條標記與該新聞的新產生新聞標記以決定是否存在相符情況與該相符程度。根據該分析結果,可以識別該新聞與該最新新聞頭條有關,並利用與該新接收新聞關聯之識別符將該最新新聞頭條進行標籤化的方式,建立該最新新聞頭條與該新聞之間的鏈結。該鏈結使得該新聞可以於該最新新聞頭條旁邊對該使用者呈現。
第六圖描述在第五圖所描述之最新新聞事件與標記化的替代實施例。在此實施例中,在於時間T0分鐘從內容提供者(AP)接收第一最新新聞頭條B1以及時間T0+2.2分鐘及T0+2.5分鐘從不同內容提供者於接收複數個新聞(R1、BB1)之後,該演算法偵測到由內容提供者所提供之第二最新新聞頭條B2。該第二最新新聞頭條B2可以來自於與提供該第一最新新聞頭條B1相同的內容提供者,也可以來自於其他內容提供者。在第六圖描述的實施例中,該第二最新新聞頭條B2係由其他內容提供者(UPI)所提供。一旦在時間T1分鐘時偵測從內容提供者接收該第二最新新聞頭條B2之後,該演算法首先對與儲存在該快取記憶體中有關該最新新聞頭條B1之資訊進行初始化,包含將最新新聞頭條B1初始化、將該等新聞建立之任何鏈結初始化、將該等頭條標記初始化、將該等新聞初始化,以及將與該第一最新新聞頭條B1關聯之該等相關新聞標記初始化。接著該演算法以針對將該第一最新新聞頭條B1進行標記化的相同方式,利用識別實質上描述該第二最新新聞頭條B2複數個關鍵字的方式,對該第二最新新聞頭條B2進行標記化。該等已識別關鍵字則定義該第二最新新聞頭條B2的頭條標記。該第二最新新聞頭條B2與該等對應頭條標記一起儲存於該快取記憶體中。除了該最新新聞頭條與該對應頭條標記之外,該演算法也在該快取記憶體中儲存其他屬性,像是儲存與該第二最新新聞頭條B2所關聯之該第二最新新聞頭條B2的接收時間等等。接收該第二最新新聞頭條B2之時間則用於定義與該第二最新新聞頭條有關之該等新聞的衰減因子。
在一實施例中,在T1時間接收該第二最新新聞頭條B2之後,在一時間內從複數個內容提供者接收複數個新聞。如第六圖中所描述,例如在T1+0.75分鐘時從AP接收新聞AP2、在時間T1+1.5分鐘時從Reuters接收新聞R2、在時間T1+3.5分鐘時從Manila Monitor接收新聞MM1,以及在時間T1+4.25分鐘時從BBC接收新聞BBC1。當從該個別內容提供者接收每一新聞時該演算法便對該新聞進行標記化,以識別該等新聞標記。接著從該快取記憶體取得該等頭條標記,分析該等頭條標記與該等新聞標記,以決定該新聞與該最新新聞頭條之間的關係。從該分析結果決定該新聞AP2並不與該第二最新新聞頭條有關,但與該第一最新新聞頭條或是類似於該第一最新新聞頭條之新的最新新聞頭條有關。因為該新聞係於接收該第二最新新聞頭條之後以及在初始化該快取記憶體之後所接收,因此將該新聞AP2以及與此新聞有關的新聞標記儲存在該快取記憶體之中以供後續取得,其中將該快取記憶體初始化是指從該快取記憶體清除該第一最新新聞頭條以及與該第一最新新聞頭條有關的任何資料。該分析確保只在該快取記憶體中保留最新的新聞頭條與最新的新聞,因此可以對該使用者呈現與該最新新聞頭條有關的資訊。透過該分析,值得注意的是所接收的該等後續新聞係與該第二最新新聞頭條有關。如先前所提到的,做為決定該等新聞與該最新新聞頭條之間關係的部分,該演算法也根據該等新聞標記與該等頭條標記的相符程度及衰減因子,對該等相關新聞進行排序與優先化。該等新聞相對於該最新新聞頭條的排序將在該快取記憶體中動態調整,以利用相關性的順序於該最新新聞頭條下方對該使用者呈現該等最相關的新聞。
在一實施例中,已經可以在接收該第二最新新聞頭條之前,接收該第二最新新聞頭條的一或多個新聞。在此應該注意當該演算法進行該快取記憶體初始化時,該演算法只將與該第一最新新聞頭條有關的資料進行初始化。因此,不與該第一最新新聞頭條有關之該一或多個新聞以及該等相關新聞標記仍舊存在於該快取記憶體中,並用於與該第二或後續最新新聞頭條之該等頭條標記進行比對。因此,該演算法繼續清除已經對該等使用者報告/向該等使用者呈現之該最新新聞頭條以及與該最新新聞頭條有關資訊的快取記憶體,並保留尚未報告之該等新聞,因此可探掘該等未報告新聞以進行後續報告。
在一實施例中,可以接收並報告在第一最新新聞頭條中所報告的相同主題內容以作為後續最新新聞頭條。這可能在該最新新聞頭條與跨及擴展時間所發展中之新聞有關的情況中發生。在此實施例中,接收與該相同主題內容有關之較新的最新新聞頭條,將其標記化並與該等最新相關新聞一起呈現給該等使用者。因為該快取記憶體在每次接收到較新的最新新聞頭條時便被初始化,因此該第一最新新聞頭條與該等相關新聞便從該快取記憶體所清除,而該第二最新新聞頭條與該等最新相關新聞便被標記化、報告並儲存在該快取記憶體中,直到接收一後續最新新聞頭條。此固定的快取記憶體初始化有助於良好管理有限的快取記憶體資源,同時以快速及有效率的方式提供該等相關新聞。
第七A圖與第七B圖分別描述利用雜湊表格所進行之該等新聞對該最新新聞頭條的鏈結。如第七A圖中所述,所呈現之雜湊表格識別在該等各種新聞與該最新新聞頭條之間所建立的所有鏈結,如第五圖所描述之範例。在第七A圖描述的實施例中只接收單一最新新聞頭條,利用該個別新聞識別符將與該最新新聞頭條有關之複數個新聞與該最新新聞頭條進行鏈結,並進行該等新聞之間的彼此鏈結。該等新聞對該最新新聞頭條以及對彼此之間的相互鏈結關係可達成該等相關新聞的效率及快速識別,以與該最新新聞頭條一起展示。在一實施例中,如果存在超過特定預定數量的大量相關新聞,那麼便將該等相關新聞進行排序,於該預定數量以下的新聞將不與該最新新聞頭條一起呈現。在另一實施例中,當該相關新聞數量超過該預定數量時,便在該最新新聞頭條下方提供該等新聞鏈結,因此該使用者仍可存取該等新聞,以獲得該頭條的更廣泛感受。如第七A圖中雜湊表格所見,該等新聞的每一新聞都利用該通用唯一識別符(UUID)與該最新新聞頭條鏈結,也與彼此相鏈結。
第七B圖描述識別參考第六圖描述之在該等各種新聞與該最新新聞頭條之間所建立的所有鏈結的雜湊表格。在此實施例中,在一時間期從不同內容提供者接收兩個最新新聞頭條。當接收該第二最新新聞頭條時,在該快取記憶體中與該第一最新新聞頭條有關之該等頭條標記、與該第一最新新聞頭條有關之該等新聞、與該等新聞對應之該等新聞標記以及該第一最新新聞頭條及該等新聞的其他屬性將被初始化(也就是清除),以得到儲存與該第二最新新聞頭條有關之資訊以及在接收該第二最新新聞頭條之後所接收之該等新聞的空間,因此可以快速取得以進行分析並進行該相關資訊呈現。
第八圖描述本發明一實施例中一操作流程圖,該流程圖用於將從複數個內容提供者所接收之新聞與最新新聞頭條建立關聯。該當從內容提供者回應最新新聞事件而接收最新新聞頭條時,便開始該程序,如操作810所述。可以從該內容提供者之特定頻道接收該最新新聞頭條,該頻道係特定為提供此類最新新聞頭條所保留。為了回應接收該最新新聞頭條,演算法以實質即時的方式分析該最新新聞頭條,以識別實質上描述該頭條的多個關鍵字,如操作820所述。該等關鍵字定義該最新新聞頭條之該等頭條標記。將該頭條與該等頭條標記儲存在暫時快取記憶體中,用以快速取得。在接收該最新新聞頭條之後,隨時間從複數個內容提供者接收新聞,如操作830所述。提供該一或多個新聞之該等內容提供者可以與提供該最新新聞頭條之該等內容提供者相同,也可以不同。當接收新聞時,該演算法分析該新聞,以識別實質上描述該新聞之複數個新聞標記,如操作840所述。接著該演算法從該快取記憶體取得該最新新聞頭條之該等頭條標記,並分析該等頭條標記與該等新聞標記以根據比對條件決定該新聞是否與該最新新聞頭條有關,如操作850所述。根據該分析,以實質即時的方式在該新聞與該最新新聞頭條之間建立鏈結,如操作860所述。該鏈結可以利用以與該新聞關聯之識別符標籤該最新新聞頭條的方式所建立,因此當對使用者呈現該最新新聞頭條時,該相關新聞/該等相關新聞也在該最新新聞頭條旁邊呈現。只要當對該等使用者報告/呈現該等新聞時於一時間框中接收該等新聞,或是只要沒有其他最新新聞頭條發生時,便繼續進行該程序。
應該注意的是該等各種實施例係提供一種利用比對標記取代比對內容,以實質即時的方式將來自各種內容提供者之該等新聞與一最新新聞頭條進行關聯並進行呈現的方式。這形成一種將該等新聞與該最新新聞頭條進行更快且更有效率的關聯方式。利用前述的演算法,可以達到超過90%的精確率且同時維持高比對品質。該演算法花費較少功夫同時能滿足品質要求標準,像是服務層級協議標準。相關領域技術人員也可以容易想像該演算法的其他優點。
然而對於相關領域技術人員明顯的是本發明也可以在不具備這些特定細節的某些部份或全部下進行實作。在其他情況中,並不詳細敘述已被孰知的程序操作,以避免對本發明造成不必要的干擾。
本發明實施例可以利用各種電腦系統配置實作,包含手持式裝置、微處理器系統、以微處理器為基礎或可程式化之消費電子、迷你電腦、主機電腦或其他類似裝置。本發明也可以在分散式計算環境中實作,其可利用透過有線或無線網路鏈結的遠端處理裝置執行工作。
利用上述實施例,應該了解到本發明可以使用涉及在電腦系統中儲存資料之各種電腦實作操作。這些操作可以包含資料的實體轉換、資料保存以及資料展示。這些操作為那些對於物理量的實體操作。通常來說雖然並非必須,這些實體量係具備電子或磁性訊號的形式,而能夠被儲存、轉換、結合、比較或是操作。也可以在透過網路進行資料取得及傳輸期間,將資料儲存在網路中。該儲存可例如是在與伺服器關聯之網路節點處及記憶體處以及包含可攜式裝置的其他計算裝置處所進行。
在此所描述形成本發明之部分的任何操作都是可利用的機械操作。本發明也與一種執行這些操作的裝置或設備有關。該設備可以為所需目的而具體建構,或是該設備可以是一種一般目的之電腦,其可由儲存在該電腦中的電腦程式所選擇性啟動或配置。實際上,可以使用各種一般目的機器與根據在此教導所撰寫的電腦程式,或以更方便的方式建構一種更特殊化的設備以執行所需的操作。
本發明也可以體現為在電腦可讀媒介上的電腦可讀編碼。該電腦可讀媒介為任何可以儲存資料的資料儲存裝置,所儲存之資料之後可由電腦系統所讀取。該電腦可讀媒介也可以散佈於一網路連接電腦系統上,因此該以一分散形式儲存並執行該電腦可讀編碼。
雖然為了清楚了解的目的已經以某些細節描述前述發明,但明顯的是在附加申請專利範圍的觀點中可以進行某些改變與修正。據此,該等實施例僅用於例證而非限制,且本發明並布線至於在此設定的細節,並可以在附加申請專利範圍的觀點與等價物中進行修改。
100‧‧‧伺服器
102‧‧‧比對演算法
102a‧‧‧標記化器
102b‧‧‧比對器
102c‧‧‧映射器
103‧‧‧記憶體模組
104‧‧‧快取記憶體
110‧‧‧內容提供者
120‧‧‧使用者
810‧‧‧操作
820‧‧‧操作
830‧‧‧操作
840‧‧‧操作
850‧‧‧操作
860‧‧‧操作
本發明可以利用參考描述結合伴隨圖式的方式獲得最佳了解。
第一圖描述本發明一實施例中一系統的簡化塊狀圖式,該系統用比對與新聞相關之標記及與最新新聞頭條相關之標記。
第二圖描述本發明一實施例中一最新新聞事件以及與一最新新聞頭條及一新聞關聯之標記化的簡化塊狀圖式。
第三圖描述本發明一實施例中標記比對的簡化塊狀圖式。
第四圖描述本發明一實施例中鏈結該最新新聞頭條與一相關新聞的簡化塊狀圖式。
第五圖描述本發明一實施例中一最新新聞事件以及與一最新新聞頭條及複數個新聞關聯之標記化的簡化塊狀圖式。
第六圖描述本發明一實施例中一最新新聞事件識別以及與複數個最新新聞頭條及複數個新聞關聯之標記化的簡化塊狀圖式。
第七A圖描述本發明一實施例中識別該最新新聞事件與複數個新聞之間映射的簡化雜湊表格。
第七B圖描述本發明一替代實施例中識別該最新新聞事件與複數個新聞之間映射的簡化雜湊表格。
第八圖描述本發明一實施例中一操作流程圖,該流程圖用於將內容提供者間的最新新聞進行關聯。
100‧‧‧伺服器
102‧‧‧比對演算法
102a‧‧‧標記化器
102b‧‧‧比對器
102c‧‧‧映射器
103‧‧‧記憶體模組
104‧‧‧快取記憶體
110‧‧‧內容提供者
120‧‧‧使用者
权利要求:
Claims (17)
[1] 本發明申請專利主張:1.一種用於將內容提供者間最新新聞進行關聯的方法,該方法包括:從一內容提供者接收一最新新聞之最新新聞頭條;將該最新新聞頭條標記化以識別複數個頭條標記;從複數個內容提供者接收新聞;將該等新聞之每一新聞標記化,以識別複數個新聞標記;分析該複數個頭條標記與該複數個新聞標記,以決定該一或多個新聞是否與該最新頭條相關;以及根據該分析,將該一或多個相關新聞映射至該最新新聞頭條,其中該映射建立該相關一或多個新聞與該最新新聞頭條之間的關係;以及根據回應接收該最新新聞的映射,在一展示裝置上於該最新新聞頭條旁邊呈現從該一或多個內容提供者所接收之該相關一或多個新聞;其中每一操作都由一處理器所實作。
[2] 如申請專利範圍第1項所述之方法,其中將該最新新聞頭條與該新聞標記化包含,識別實質上描述該最新新聞頭條與該等新聞之每一新聞的關鍵字,該關鍵字定義代表該最新新聞頭條及該等新聞之個別項的標記。
[3] 如申請專利範圍第1項所述之方法,其中分析該複數個頭條標記與該複數個新聞標記進一步包含:將與該最新新聞頭條關聯的頭條標記以及與該等新聞之每一新聞關聯的新聞標記進行比較;以及根據一預定比對條件識別具有與該頭條標記相符之新聞標記的新聞,該預定比對條件形成比對要求。
[4] 如申請專利範圍第3項所述之方法,其中該預定比對條件定義每一新聞之新聞標記的最小百分比,該每一新聞之新聞標記必須與該最新新聞頭條之頭條標記相符。
[5] 如申請專利範圍第3項所述之方法,其中該預定比對條件建立一時間框,用以報告該最新新聞頭條與從該內容提供者所接收之該等新聞的每一新聞。
[6] 如申請專利範圍第5項所述之方法,其中分析該複數個頭條標記與該複數個新聞標記進一步包含:識別從該內容提供者接收該最新新聞頭條的時間;識別從該複數個內容提供者之每一內容提供者接收該等已識別新聞的每一新聞的時間,該等已識別新聞的每一新聞具有與該頭條標記相符之標記;以及過濾該已識別新聞以選擇該新聞的一子集合,其中根據在該預定比對條件中所建立用於報告該最新新聞頭條的時間框進行該新聞子集合選擇。
[7] 如申請專利範圍第6項所述之方法,其中映射該一或多個新聞進一步包括:提供該最新新聞頭條與該已選擇新聞子集合中該已識別新聞之每一新聞之間的鏈結,該鏈結建立該最新新聞頭條與該已識別新聞之每一新聞之間的關係;其中利用該個別新聞之一識別符,對該最新新聞頭條標籤化的方式建立該鏈結。
[8] 如申請專利範圍第7項所述之方法,其中映射該一或多個新聞進一步包括:當在該新聞子集合中選擇多於一項新聞時,於該新聞子集合中該等新聞之每一新聞與其他新聞之間建立一鏈結,該鏈結建立該新聞子集合中該等新聞之間的關係;其中利用該新聞子集合中該等其他新聞之每一新聞對應識別符,對該等新聞之每一新聞標籤化的方式建立該鏈結。
[9] 如申請專利範圍第1項所述之方法,進一步包含,從一內容提供者接收一第二最新新聞頭條;進行該頭條標記與該新聞標記初始化;以及產生代表該第二最新新聞頭條之一組新的頭條標記,該組新的頭條標記於建立與從該複數個內容提供者所接收之新聞之間的關係時使用。
[10] 如申請專利範圍第1項所述之方法,其中提供該等新聞之至少一新聞的該內容提供者,是與提供該最新新聞頭條之該內容提供者相同,其中該內容提供者使用不同頻道傳輸該最新新聞頭條與該等新聞。
[11] 如申請專利範圍第10項所述之方法,其中當一特定內容提供者提供與該最新新聞頭條有關之複數個新聞時,該複數個新聞的每一新聞都被分別保存並進行標記化以產生不同的新聞標記,用以與該最新新聞頭條的頭條標記比對。
[12] 如申請專利範圍第1項所述之方法,其中提供該最新新聞頭條之該內容提供者與提供該等新聞之該複數個內容提供者不同。
[13] 如申請專利範圍第1項所述之方法,進一步包括:在該計算裝置之一快取記憶體中保存該最新新聞頭條與該等新聞,以能夠快速取得該最新新聞頭條與該等新聞,用以在實質即時中進行該最新新聞頭條與與該最新新聞頭條有關之該等新聞的動態標記化、比對與呈現。
[14] 一種電腦程式,該電腦程式嵌入於一非暫時電腦可讀儲存媒介中,該電腦程式經配置以由一或多個處理器執行,用以在內容提供者間建立最新新聞的關聯,該電腦程式包括:用以從一內容提供者接收代表一最新新聞之一最新新聞頭條的程式指令;用以利用識別複數個頭條標記的方式實質即時對該最新新聞頭條進行標記化的程式指令;用以從複數個內容提供者接收新聞的程式指令;用以實質即時對該等新聞之每一新聞進行標記化,以識別複數個新聞標記的程式指令;用以分析該複數個頭條標記與該複數個新聞標記,以決定該一或多個新聞是否與該最新新聞頭條有關的程式指令;以及用以根據該分析,將該一或多個新聞映射至該最新新聞頭條的程式指令,其中該映射映射建立該相關一或多個新聞與該最新新聞頭條之間的關係,該映射能夠呈現該最新新聞頭條之來自於該一或多個內容提供者的該一或多個新聞。
[15] 如申請專利範圍第14項所述之程式指令,其中該最新新聞頭條與該相關新聞是儲存在一暫時快取記憶體中以進行快速取得,該暫時快取記憶體進一步儲存與該最新新聞頭條有關之該頭條標記,也儲存與從該複數個內容提供者所接收之該等新聞有關之新聞標記。
[16] 如申請專利範圍第14項所述之程式指令,其中用於分析該複數個頭條標記與該複數個新聞標記的該電腦程式進一步包含,用以比較與該最新新聞頭條關聯之該頭條標記及與該等新聞之每一新聞關聯之該等新聞標記的程式指令;以及用以識別根據一預定比對條件而具有與該頭條標記相符之新聞標記之新聞的程式指令,該預定比對條件形成比對要求。
[17] 如申請專利範圍第16項所述之程式指令,其中用以映射該一或多個新聞之該電腦程式進一步包含:用以提供該最新新聞頭條與該已識別新聞之每一新聞之間鏈結的程式指令,該已識別新聞之每一新聞具有與該最新新聞頭條之該頭條標記相符的新聞標記,該鏈結建立該最新新聞頭條與該已識別新聞之每一新聞之間的關係,其中利用與該等已識別新聞關聯之識別符將該最新新聞頭條標籤化的方式建立該鏈結;以及用以建立該等新聞之每一新聞與該等其他新聞之間鏈結的程式指令,該鏈結建立該等已識別新聞之間的關係;其中利用與該最新新聞頭條有關之該等其他新聞之該等識別符將該等新聞之每一新聞標籤化的方式建立該鏈結。
类似技术:
公开号 | 公开日 | 专利标题
CN107844565B|2021-07-16|商品搜索方法和装置
US8869025B2|2014-10-21|Method and system for identifying advertisement in web page
TW201001205A|2010-01-01|Search results with most clicked next objects
TW200935260A|2009-08-16|System and method for inclusion of interactive elements on a search results page
US20210035126A1|2021-02-04|Data processing method, system and computer device based on electronic payment behaviors
TWI539306B|2016-06-21|Information delivery method, processing server and merge server
US20160092553A1|2016-03-31|Methods and apparatuses of generating and using a structured label
TWI489409B|2015-06-21|不同內文提供者間相關最新新聞之即時關聯
TW201516938A|2015-05-01|用戶資訊的分類、用戶分組資訊的獲取方法和設備
CN104090899B|2016-04-27|一种反馈展示内容信息的方法和装置
CN105095470A|2015-11-25|用于应用程序的数据推荐方法及装置
US20150302466A1|2015-10-22|Data determination method and device for a thermodynamic chart
KR20190067165A|2019-06-14|콘텐츠 추천 및 디스플레이
WO2021082499A1|2021-05-06|一种资源的标注管理系统
WO2019072098A1|2019-04-18|一种识别核心产品词的方法和系统
CN103488675A|2014-01-01|一种多网页新闻评论内容自动精确提取装置
WO2021104513A1|2021-06-03|对象展示方法、装置、电子设备及存储介质
JP2016012337A|2016-01-21|検索結果表示方法および装置
US20150348160A1|2015-12-03|Automatic selection of featured product groups within a product search engine
CN105989167B|2019-11-08|基于新闻客户端的数据采集方法及装置
KR20130021945A|2013-03-06|상품 정보 자동 추출 방법 및 장치
JP2014074942A|2014-04-24|情報収集プログラム、情報収集方法および情報処理装置
JP5216654B2|2013-06-19|重要度判定装置、重要度判定方法、およびプログラム
CN106570004B|2021-03-30|一种数据管理方法及装置
WO2020164283A1|2020-08-20|测试设备的共享方法、装置、存储介质及计算机设备
同族专利:
公开号 | 公开日
WO2012141867A3|2012-12-06|
US8615518B2|2013-12-24|
WO2012141867A2|2012-10-18|
US20120259853A1|2012-10-11|
TWI489409B|2015-06-21|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
US7398201B2|2001-08-14|2008-07-08|Evri Inc.|Method and system for enhanced data searching|
US7523109B2|2003-12-24|2009-04-21|Microsoft Corporation|Dynamic grouping of content including captive data|
US8676837B2|2003-12-31|2014-03-18|Google Inc.|Systems and methods for personalizing aggregated news content|
US8126865B1|2003-12-31|2012-02-28|Google Inc.|Systems and methods for syndicating and hosting customized news content|
US7293019B2|2004-03-02|2007-11-06|Microsoft Corporation|Principles and methods for personalizing newsfeeds via an analysis of information novelty and dynamics|
US9495467B2|2004-10-13|2016-11-15|Bloomberg Finance L.P.|System and method for managing news headlines|
US7739254B1|2005-09-30|2010-06-15|Google Inc.|Labeling events in historic news|
US20070260586A1|2006-05-03|2007-11-08|Antonio Savona|Systems and methods for selecting and organizing information using temporal clustering|
US20090254510A1|2006-07-27|2009-10-08|Nosa Omoigui|Information nervous system|
US20080092077A1|2006-09-14|2008-04-17|Cqgt, Llc|Interactive streaming news headline display|
KR20090003066A|2006-12-04|2009-01-09|한국전자통신연구원|실시간 맞춤형 뉴스정보 제공 장치 및 그 방법|
US8442969B2|2007-08-14|2013-05-14|John Nicholas Gross|Location based news and search engine|
WO2009029956A2|2007-08-31|2009-03-05|Jacked, Inc.|User generated content|
US20090070346A1|2007-09-06|2009-03-12|Antonio Savona|Systems and methods for clustering information|
US7720870B2|2007-12-18|2010-05-18|Yahoo! Inc.|Method and system for quantifying the quality of search results based on cohesion|
US8239397B2|2009-01-27|2012-08-07|Palo Alto Research Center Incorporated|System and method for managing user attention by detecting hot and cold topics in social indexes|
US8452781B2|2009-01-27|2013-05-28|Palo Alto Research Center Incorporated|System and method for using banded topic relevance and time for article prioritization|
US20100281025A1|2009-05-04|2010-11-04|Motorola, Inc.|Method and system for recommendation of content items|
US9116995B2|2011-03-30|2015-08-25|Vcvc Iii Llc|Cluster-based identification of news stories|US20130086036A1|2011-09-01|2013-04-04|John Rizzo|Dynamic Search Service|
US8719279B2|2012-02-24|2014-05-06|Strategic Communication Advisors, LLC.|System and method for assessing and ranking newsworthiness|
US8826125B2|2012-03-12|2014-09-02|Hyperion Media LLC|System and method for providing news articles|
法律状态:
优先权:
申请号 | 申请日 | 专利标题
US13/084,352|US8615518B2|2011-04-11|2011-04-11|Real time association of related breaking news stories across different content providers|
[返回顶部]